2024 中国开放数林指数发布 |复旦DMG
2024年9月26日,复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院,在第三届全球数字贸易博览会“全球智慧城市大会·杭州”上发布了“2024中国开放数林指数”和《中国地方公共数据开放利用报告——省域》《中国地方公共数据开放利用报告——城市》。
开放数据,蔚然成林,“中国开放数林指数”是我国首个深耕于公共数据开放领域的专业指数,由复旦大学数字与移动治理实验室制作。自2017 年首次发布以来,“中国开放数林指数”每年对我国地方公共数据开放利用水平进行综合评价,精心测量各地的“开放数木”,助推我国公共数据的供给流通与价值释放。
开放数据,蔚然成林,“开放数林”意喻我国公共数据开放利用的生态体系,我们期待:
开放数林有深根沃壤。只有始终根植于肥沃的“黑土地”上,“数木”才能在充足养分的供给下,固本培元,厚积薄发。
开放数林能去芜存菁。只有修去徒增负担的“冗枝”,剪掉有形无用的“败叶”,“数木”才能强化主干,萌发新枝。
开放数林可普惠共济。各类主体,不分大小亲疏,都可在“大数”下乘凉用材,摘果饮浆,共享其利。
最终,一个个地方的开放“数木”将共同成长为一片根深叶茂、生生不息、人人得益的中国开放数林。
数林概貌
截至2024年7月,我国已有243个省级和城市的地方政府上线了数据开放平台,其中省级平台24个(不含直辖市和港澳台),城市平台219个(含直辖市、副省级与地级行政区)。与2023年相比,新增2个省级平台和15个城市平台,平台总数增长约8%。目前,我国89%的省级行政区(不含直辖市和港澳台)和65%的城市(包括直辖市、副省级与地级行政区)已上线了公共数据开放平台。
截至2024年7月,全国各省域数据开放平台的整体上线情况如下图所示。省域包括省(自治区)本级和省内下辖地市,图中颜色越深,代表该省域公共数据开放平台的整体上线程度越高。目前,福建、广东、广西、贵州、黑龙江、湖北、江苏、江西、山东、四川与浙江共11个省域的省(自治区)本级和下辖所有地市都已上线了数据开放平台(图中显示为全境深绿色的省域)。从整体上看,东南沿海、华中和西南地区的数据开放平台已经基本相连成片。
自2017 年中国开放数林指数首次发布以来,各地平台上开放的有效数据集总数逐年增长(如下图所示),2017 年全国所有地方只开放了八千多个数据集, 2024 年已增长到 37万多个,是八年前的44倍。
数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。2019年以来各地平台无条件开放的可下载数据集的容量从2019年的约15亿到2024年超679亿,六年间增长了45倍。
基于《“数据要素×”三年行动计划(2024—2026年)》中的12个重点领域,各地在重点领域开放的有效数据集总数如下图所示,城市治理、金融服务、绿色低碳等重点领域开放的有效数据集总数最多,其次是交通运输、现代农业、文化旅游、医疗健康等领域,工业制造、应急管理与气象服务领域开放的数据集较少。
报告梳理了目前各地平台累计下载数量最高的十类数据集的名称、下载数量与地方平台开放比例。从下表中可见,虽然目前社会对这些数据集的需求较高,但在全国各地方的开放比例仍然较低。
数林指数
2024年度全国省域开放数林指数分值如下表所示。报告还基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”:山东、浙江综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖;贵州与福建也总体表现优秀,进入第二等级“四棵数”;其次是四川、广东、广西等地。在四个单项维度上,山东在数据层和利用层上表现最优,浙江在保障层表现最优,贵州在服务层上表现最优。
2024年度全国城市开放数林的指数分值如下表所示。报告还基于综合指数分值将各地的公共数据开放利用水平分为五个“开放数级”:杭州与济南综合表现最优,进入第一等级“五棵数”,获得“数开繁盛”大奖;德州、温州、日照、济宁与台州也表现优异,进入第二等级“四棵数”;其次是上海、滨州、成都、深圳、无锡、北京、东营等城市。在四个单项维度上,在全国所有219个城市中,杭州在保障层、服务层和数据层上表现最优,济南在利用层上表现最优。
四个直辖市开放数林指数分值和排名如下表所示,上海市综合表现最优,位列第一。
副省级开放数林指数排名前十的地方如下表所示,杭州综合表现最优,位列第一,济南、成都、深圳、青岛也表现优异。
地级开放数林指数排名前十的城市如下表所示,德州综合表现最优,位列第一;温州、日照、济宁、台州、滨州和无锡等地也表现优异。
“数林匹克”指数
报告进一步通过“数林匹克”累计分值,反映一个地方在过去四年(2021年-2024年)开放数据的持续水平。下表展示了2021-2024省域“数林匹克”累计分值排在前十名的地方,浙江分值最高,其次是山东、贵州和四川。
报告还展示了2021-2024城市“数林匹克”累计分值排在前二十名的地方,杭州分值最高,其次是德州、济南、上海、日照与青岛等城市。
数林长势
报告发现:
各地公共数据开放基础保障能力不断提升,以法规政策、标准规范、组织保障来支撑公共数据开放与利用。部分地方已构建了较为完备的法规政策体系,有些省形成了全省统一的标准规范。部分地方连续制定和发布公共数据开放年度工作计划与开放清单。然而,多数地方对公共数据开放年度计划的重视程度仍旧不足,存在未制定、不连续、内容不充分等问题。
各地平台服务水平取得明显进展,11个省域的所有地市均上线了数据开放平台,并逐步实现了省市间前台入口及后台账户的互联互通,使用户可在省域内部进行“无感漫游”。全国多数地方平台能够提供稳定优质的数据发现、数据获取和数据利用服务,部分地方正在探索更深度、更智能的服务方式(如字段搜索)。然而,部分地方在数据开放服务运营上仍存在不足:一是在平台使用与数据获取过程中设置了过高门槛或繁琐流程,便利性不足;二是某些功能缺少维护而“僵尸化”,缺乏实用性;三是对来自用户的各类反馈及诉求无法进行及时有效的回应,互动性有待提升。
各地公共数据开放数量质量不断提升,显示出各地加大公共数据供给的成效。然而不少地方对高下载、高利用数据的开放程度仍然不足。此外,各地对于时效性较高的数据所提供的API接口数量虽有增长,但总量仍较少,当前仅极少数地方开放了少量能够每天更新的数据接口。各地无条件开放的数据接口虽然总量较多,但普遍存在需要申请且申请后无响应、使用说明不清晰、无法调用、无数据或数据不更新等问题。在数据质量方面,各地都能在守住开放数据安全性底线的前提下,在数据可获取性、格式可用性、数据可理解性、内容完整性等方面取得明显进步。但是,少部分地方平台在数据可获取性方面仍存在不少问题。例如,被列为“无条件开放”的数据却需要申请甚至申请后也无响应、对下载数据设置了重重限制、数据文件无法打开或打开后无内容等问题。各地开放数据的及时更新程度不高,全国无条件开放的数据集中能够按年度更新的数据占比仅有16%,部分平台数据甚至出现曾经开放后又中断供给的现象。
各地已利用开放数据开发了多种便利民众生活的场景应用,释放出了较大的社会公益价值和科研价值。例如,部分地方开放的停车场数据对市场开发的停车导航应用提供了支撑,有些地方利用开放数据实现了公交实时到站预报服务和无障碍设施导航服务,部分地方开始探索AED设备、新能源充电站、母婴设施的搜寻服务。各地高校的师生也利用开放数据开展研究,已发表超过130篇明确引用各地开放数据的科研论文。然而,各地开放数据对于数字经济的价值释放作用仍然不足,只有少部分地方在信用贷款、商业医保、开业创业等场景产生了有效应用,也只有极少数地方的特色场景应用是“真创新”,能够孵化落地和持续运营。
开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会立足我国公共数据开放的政策要求与地方实践,基于数据开放的基本理念和学术成果,借鉴国际数据开放评估经验,构建起一个系统、专业、可操作的公共数据开放评估指标体系,并每年根据最新发展态势和重点难点问题进行动态调整。2024开放数林指数在指标体系和评估方法上的调整重点主要包括:
2024开放数林指数在指标体系和评估方法上的调整重点主要包括:
坚守公共数据供给的“基本面”
将评估维度“准备度”更名为“保障层”
关注服务实效与创新探索
强调高利用、高需求数据的数量与质量
强调利用成果的实际效果而非“形式主义“成果
2024中国开放数林指数指标体系框架如下图所示,评估指标体系共包括保障层、服务层、数据层、利用层四个维度及下属多级指标。其中,保障层是“数根”,是数据开放的基础;服务层是“数干”,是数据开放的中枢;数据层是“数叶”,是数据开放的产出;利用层是“数果”,是数据开放的成效。